1. Nessa parte faremos a importação dos dados de ocorrência da espécie do repositório GBIF, limpeza, filtragem e validação.

1.1. Importação e limpeza

1.1.1. Pacotes necessários para a execução das análises
library(tidyverse)
library(rgbif)
library(dplyr)
library(bdc)
library(CoordinateCleaner)
library(ggmap)
library(maps)
library(mapdata)
library(plotly)
1.1.2. Baixando ocorrências de Anacardium occidentale.
ana_gbif <- occ_data(scientificName = "Anacardium occidentale", 
                      hasCoordinate = TRUE,
                      hasGeospatialIssue=FALSE)
1.1.3. Agora usaremos a função gbif_issues na avaliação dos problemas relatados para o conjunto de dados.
# checar problemas reportados
issues_gbif <- ana_gbif$data$issues %>% 
  unique() %>% 
  strsplit(., "[,]") %>% 
  unlist()

gbif_issues() %>% 
  data.frame() %>% 
  filter(code %in% issues_gbif)
##      code                              issue
## 1     cdc CONTINENT_DERIVED_FROM_COORDINATES
## 2 cdround                 COORDINATE_ROUNDED
## 3    cudc   COUNTRY_DERIVED_FROM_COORDINATES
## 4  gass84       GEODETIC_DATUM_ASSUMED_WGS84
## 5 colmafu             COLLECTION_MATCH_FUZZY
## 6  inmafu            INSTITUTION_MATCH_FUZZY
## 7  inmano             INSTITUTION_MATCH_NONE
##                                                                                                                                description
## 1                                              The interpreted continent is based on the coordinates, not the verbatim string information.
## 2                                                                                  Original coordinate modified by rounding to 5 decimals.
## 3                                                The interpreted country is based on the coordinates, not the verbatim string information.
## 4 Indicating that the interpreted coordinates assume they are based on WGS84 datum as the datum was either not indicated or interpretable.
## 5                                                                      The given collection was fuzzily matched to a GrSciColl collection.
## 6                                                                    The given institution was fuzzily matched to a GrSciColl institution.
## 7                                                                The given institution couldn't be matched with any GrSciColl institution.
##         type
## 1 occurrence
## 2 occurrence
## 3 occurrence
## 4 occurrence
## 5 occurrence
## 6 occurrence
## 7 occurrence
1.1.4. Visualizando as dimensões e campos do arquivo
# verificando as dimensões do arquivo
dim(ana_gbif)
## NULL
# Detalhando os campos do arquivo
dim(ana_gbif$data)
## [1] 500 118
ana_gbif$data %>% names
##   [1] "key"                           "scientificName"               
##   [3] "decimalLatitude"               "decimalLongitude"             
##   [5] "issues"                        "datasetKey"                   
##   [7] "publishingOrgKey"              "installationKey"              
##   [9] "publishingCountry"             "protocol"                     
##  [11] "lastCrawled"                   "lastParsed"                   
##  [13] "crawlId"                       "hostingOrganizationKey"       
##  [15] "basisOfRecord"                 "occurrenceStatus"             
##  [17] "taxonKey"                      "kingdomKey"                   
##  [19] "phylumKey"                     "classKey"                     
##  [21] "orderKey"                      "familyKey"                    
##  [23] "genusKey"                      "speciesKey"                   
##  [25] "acceptedTaxonKey"              "acceptedScientificName"       
##  [27] "kingdom"                       "phylum"                       
##  [29] "order"                         "family"                       
##  [31] "genus"                         "species"                      
##  [33] "genericName"                   "specificEpithet"              
##  [35] "taxonRank"                     "taxonomicStatus"              
##  [37] "iucnRedListCategory"           "dateIdentified"               
##  [39] "continent"                     "stateProvince"                
##  [41] "year"                          "month"                        
##  [43] "day"                           "eventDate"                    
##  [45] "modified"                      "lastInterpreted"              
##  [47] "references"                    "license"                      
##  [49] "isInCluster"                   "datasetName"                  
##  [51] "recordedBy"                    "identifiedBy"                 
##  [53] "geodeticDatum"                 "class"                        
##  [55] "countryCode"                   "country"                      
##  [57] "rightsHolder"                  "identifier"                   
##  [59] "http://unknown.org/nick"       "verbatimEventDate"            
##  [61] "collectionCode"                "gbifID"                       
##  [63] "verbatimLocality"              "occurrenceID"                 
##  [65] "taxonID"                       "catalogNumber"                
##  [67] "institutionCode"               "eventTime"                    
##  [69] "http://unknown.org/captive"    "identificationID"             
##  [71] "coordinateUncertaintyInMeters" "occurrenceRemarks"            
##  [73] "recordNumber"                  "municipality"                 
##  [75] "locality"                      "language"                     
##  [77] "type"                          "ownerInstitutionCode"         
##  [79] "sampleSizeUnit"                "sampleSizeValue"              
##  [81] "samplingProtocol"              "eventID"                      
##  [83] "habitat"                       "institutionID"                
##  [85] "verbatimSRS"                   "county"                       
##  [87] "verbatimIdentification"        "vernacularName"               
##  [89] "organismID"                    "fieldNotes"                   
##  [91] "projectId"                     "individualCount"              
##  [93] "elevation"                     "elevationAccuracy"            
##  [95] "reproductiveCondition"         "distanceFromCentroidInMeters" 
##  [97] "informationWithheld"           "organismName"                 
##  [99] "higherClassification"          "organismQuantity"             
## [101] "organismQuantityType"          "preparations"                 
## [103] "georeferenceProtocol"          "dynamicProperties"            
## [105] "verbatimCoordinateSystem"      "name"                         
## [107] "institutionKey"                "collectionKey"                
## [109] "programmeAcronym"              "fieldNumber"                  
## [111] "eventRemarks"                  "locationRemarks"              
## [113] "locationID"                    "islandGroup"                  
## [115] "island"                        "identificationQualifier"      
## [117] "acceptedNameUsageID"           "verbatimElevation"

1.2. Filtragem dos dados

1.2.1. Sem nenhum problema sério, vamos filtrar algumas informações necessárias a execução das análises.
ana_gbif1 <- ana_gbif$data %>%
  dplyr::select(scientificName, acceptedScientificName, decimalLatitude, decimalLongitude,
         issues, basisOfRecord, occurrenceStatus, rightsHolder, 
         datasetName, recordedBy, locality,habitat,stateProvince) 
1.2.3. Temos 500 ocorrências com 13 variáveis. Aplicaremos a função distinc filtrando somente as variáveis que são únicas.
ana_gbif1 <- ana_gbif1 %>% 
  distinct() 
1.2.4. Após a função, ficamos com 484 dados de ocorrência. Para identificar todos os valores únicos presentes nos dados, vamos aplicar a função unique a cada coluna com um loop na função lapply.
lapply(ana_gbif1, unique)
## $scientificName
## [1] "Anacardium occidentale L."
## 
## $acceptedScientificName
## [1] "Anacardium occidentale L."
## 
## $decimalLatitude
##   [1]  17.556047  11.323038  13.828233  13.817147  18.464255   1.439759
##   [7]  17.152981   1.439727  15.300090  19.341050  17.772943  11.262541
##  [13]  11.281107  13.122776  15.407795  18.116757  11.323047  -4.755673
##  [19]  18.430249  18.289342  18.290397 -21.349781   4.347804  16.270681
##  [25] -11.463333  13.282053  13.280870  13.282396  13.375288  13.298588
##  [31] -23.519000 -22.643894 -23.572243  10.084035  -9.687809 -24.314611
##  [37] -24.314529  -2.249503  11.172810  15.668647  -4.424948  -8.827273
##  [43] -23.186445 -12.881309  13.030940 -19.625303 -12.687058 -16.618730
##  [49] -10.941110  -9.959818  14.041401   6.532534  -6.877936  -7.369059
##  [55]  12.680157  14.566240  -6.849975 -22.797523 -20.774886 -22.489743
##  [61] -13.080529  -3.229176 -15.773898 -13.091667  13.300021 -23.463767
##  [67] -23.826440  10.599720  -0.593407 -21.225979  13.924878  16.243317
##  [73] -21.169189  16.271423  19.290001  -7.957312  15.995844 -22.861798
##  [79] -22.861770  16.222384  18.288523  11.323274   7.306850  15.840667
##  [85]  13.889780  13.894391  13.905498  13.890161  13.898290  13.893520
##  [91]  13.889059  -5.211799  10.302143  12.698238  16.492163  17.719658
##  [97]  16.306228 -19.462305  16.794469  16.179511  15.564441  14.775172
## [103] -17.711585  14.466861  14.728458  15.455756 -22.990388 -23.516326
## [109] -22.910572   8.763540 -22.797068  17.899336 -21.817052 -21.244022
## [115] -22.145955 -23.447355  23.113486  20.648719  -8.171833  17.719218
## [121]  21.902940  17.291354  16.238312 -22.956279  16.306242  16.306197
## [127]  16.306254  16.306226  -7.320706 -19.738584 -21.787197  15.358543
## [133]  13.114117 -18.961408  12.817623 -20.772595  -7.199772  14.466827
## [139]  13.877822  15.435948 -22.445285 -22.832242  13.270628  17.999443
## [145]  -8.960712  13.205305  19.189309   9.304498  18.330558  16.210599
## [151]  16.210464 -19.888725  -7.934693 -21.216157 -23.096101 -15.747333
## [157] -19.504428  10.221090   3.350751   8.846572   7.453526  15.899552
## [163]  13.046340   8.434574  14.630231  11.511732  19.248142   9.787463
## [169] -10.224691 -10.224484  12.944252 -22.915694  -5.888305 -11.100292
## [175] -13.293427 -21.727040 -15.895404   9.803793  12.817676 -21.968595
## [181] -22.955719  -7.234563  16.073698  17.421087 -23.304446  12.197381
## [187]   5.745918 -22.861813  18.371210 -18.527657 -27.973017 -12.527818
## [193]  19.579167  -5.669302  14.992077 -20.544430  11.549421  -8.254354
## [199]  15.000573  14.140597  -7.958900  14.563687 -23.214277  13.180770
## [205]  13.812459  -5.131799  -6.205468  16.383034  16.337783  -1.901082
## [211]  -7.820762  11.017115  16.249490  12.006237  -9.853997  -9.854159
## [217]  -9.954691 -22.578881  12.916994 -16.376244  11.450730  18.462105
## [223]  18.462647  18.462245 -22.917362  18.135014  17.555065  16.223153
## [229]  18.354420  18.317972   9.338282  11.323561 -10.010350  18.114583
## [235]   9.760682  16.116076   1.438192  22.420944  12.408784  22.543800
## [241]  27.100500  10.982472  11.040000   9.466711  16.122470  13.180003
## [247] -23.160178 -19.783611  13.827566   8.353647  14.484031  14.765275
## [253] -16.497122   7.100972 -15.865108 -22.925340   7.891621  17.039314
## [259]  11.997398  15.140684  16.249442   4.987372 -22.999238  16.356542
## [265] -18.191281 -15.964002 -23.160175  16.305666 -22.145924 -14.700094
## [271] -16.655402  16.216722  16.305456 -23.630824 -22.491418 -24.062795
## [277] -23.233513 -22.982857   0.557582  13.547402  -8.346514  16.249422
## [283] -23.388117  20.647930 -16.385550 -22.939607  13.547433  13.547338
## [289]  13.547366 -17.786198 -16.185030  14.569794   9.451838   6.326230
## [295]   6.853512  17.126043   4.924965   2.845302 -19.253526 -24.314370
## [301]  16.326220 -20.430543  16.326366  22.625093 -12.955888 -16.555440
## [307]  17.755570  10.236507  16.831242 -16.622426  -3.932077  -5.094684
## [313]  19.063419 -15.742940   5.399245  -2.980833  16.248115  20.340189
## [319]  20.340470 -21.154266  14.466093  -3.724111 -21.778353  14.978365
## [325] -23.458074 -23.261723 -12.326094  13.680488  13.746393  16.429684
## [331] -15.744258 -23.380154 -15.812542  11.589890 -12.983402  16.250984
## [337]   3.815307 -24.357502 -22.613056 -19.203603 -22.544227 -22.591043
## [343] -12.763879 -12.763929   6.235810   6.017768 -22.224488 -15.760284
## [349] -27.974470  -7.163178 -15.665043 -21.345314 -15.722170   0.300133
## [355]   8.444077   9.111595  13.980945 -10.401111  20.660586  23.127056
## [361] -22.981528 -23.181402 -22.020017 -16.915138 -15.734377  14.488845
## [367] -23.964226  17.755207  -3.474569  14.789233 -22.883432  -9.945538
## [373]  14.639973  11.028109  -9.115535  17.720080 -12.529078 -22.939329
## [379]  11.975183 -23.359757  -7.917223  -4.179877 -15.825898  -9.451414
## [385] -15.825023 -23.412547  18.155472  12.070557 -22.911758  14.487984
## [391] -16.758464  13.038098 -16.469286   9.377770   7.891719 -15.977058
## [397]  15.868005 -22.579302 -21.110943 -17.818915 -15.576383   9.996812
## [403] -23.822304  -8.240434 -14.019717 -14.019722 -23.253262   9.557960
## [409]  19.298494 -11.590278 -17.620673 -21.021194   3.563653  12.417650
## [415] -20.519318   6.552787  -7.549916  14.436831   6.562373  16.275336
## [421]  18.315441 -19.010371   4.926380  -9.181546  -2.502116  -4.147070
## [427] -23.787523 -17.398786 -17.391843  -4.764928 -14.063878   2.931063
## [433]  -8.738285  -2.064408 -22.322324 -22.434435  16.305068 -19.030362
## [439]  18.706519 -18.938500  -3.780317  16.241011 -19.915726 -13.319338
## [445]  11.319806  -3.198276 -16.589136  -3.396639  -4.661970  -4.661290
## [451]  11.011440 -15.870508  19.018288   8.353582 -12.313623 -15.581048
## [457]  15.909323 -22.527565 -15.782672   9.337395  16.268200  13.384008
## [463]  18.716197  18.711594 -19.551215  13.384357  13.378222  11.828377
## [469] -10.924026 -16.181751 -15.546916  13.495199  -8.049968  11.797418
## [475] -20.084068 -22.760882 -22.839132  -3.912646 -16.261256   9.467312
## [481]  -3.665876 -12.904449
## 
## $decimalLongitude
##   [1]  -88.534449   79.243353  -89.356133  -61.056686  -66.284547  103.807032
##   [7]  -88.665884  103.806934   73.929488  -70.997197  -88.540533  -85.858606
##  [13]  -85.871816   74.993319  -88.017649  -65.481687   55.475589   72.955435
##  [19]   73.129439   73.126474  -48.006389  -72.851548  -61.304139  -37.363611
##  [25]  -16.594601  -16.552066  -16.553031  -15.817588  -16.569770  -47.615535
##  [31]  -50.481235  -48.394226   76.273074  -36.507973  -47.254170  -47.254187
##  [37]  -79.650087   -4.295870  -88.973113   39.397233  -35.337806  -46.870298
##  [43]  -38.284341   74.964532  -44.041316  -38.578440  -39.094647  -37.096745
##  [49]  -67.855722  -89.310035  -75.774367  -39.190601  -35.907228   80.130296
##  [55]   75.006897   37.657356  -43.197418  -51.692093  -43.534882  -39.943584
##  [61]  -52.233350  -52.565498  -39.946667  -88.905814  -47.252947   35.533421
##  [67]   14.346643  -80.391683  -50.473685  -90.603368  -61.384121  -47.811795
##  [73]  -61.805717   72.805840  -35.146867  -61.722739  -42.340296  -42.340398
##  [79]  -61.627368   73.129353   79.239393   99.399796  -97.043664  -90.477880
##  [85]  -90.481311  -90.523835  -90.482740  -90.478768  -90.481479  -90.471112
##  [91]  -36.456620   76.427384   74.900339   73.650497   77.698777  -61.302641
##  [97]  -44.204762  -62.188239  -61.656945   73.836104  -17.346236  -48.152940
## [103]  -60.923666  -61.015333   73.807640  -43.484909  -46.641382  -43.296289
## [109]  -75.887597  -41.930375  -62.835773  -47.248966  -47.830828  -51.373183
## [115]  -46.456365   89.940907 -105.228871  -35.764394   77.696823   77.872240
## [121]   81.885854  -61.402688  -43.351081  -61.302685  -61.302602  -61.302727
## [127]  -61.302635  -35.327168  -47.933296  -48.177145   74.541915   77.716687
## [133]  -49.476270   74.842879  -41.164418  -34.848622  -60.923754  -16.375768
## [139]   74.983192  -43.176703  -43.420082  -59.614176  -66.106089  -38.246932
## [145]  -16.471983  -70.205089    2.626673  -65.839365  -61.501608  -61.501663
## [151]  -40.586611  -35.027802  -50.873830  -46.434167  -47.663639  -43.913034
## [157]    1.387545  -59.810687  -76.423225  -80.082115  -96.938638   80.253356
## [163]  -80.123725   74.052564   92.686567 -103.714146   78.638618  -48.306635
## [169]  -48.306651  -16.739116  -42.844876  -35.175337   39.676910  -40.966623
## [175]  -48.189551  -47.969985   98.449664   74.842939  -48.860010  -43.349291
## [181]  -48.252081  -61.579308   78.242440  -45.816931   76.746336  -53.947070
## [187]  -42.340342  -65.897382  -46.051811   32.321203  -55.699167   81.667778
## [193]  -37.829951  -16.747283  -40.394368   79.730698  -34.988872  -16.779615
## [199]  -89.753028  -34.996900  -60.927541  -47.449837   77.599492  -87.969893
## [205]  119.485061  -35.360228  -61.484310  -61.372003   37.757418  -38.149275
## [211]  -74.932465  -61.525188   79.806984  -56.076042  -56.076207  -67.801851
## [217]  -47.185330   77.626583  -49.841630   75.834330  -69.645075  -69.644918
## [223]  -69.645008  -42.058607  -65.425447   82.242780  -61.676200  -66.036770
## [229]  -67.214372    2.387430   79.238778  -38.336003  -65.948233  100.015433
## [235]   73.689362  103.788960  -81.184278  109.243475   88.343200   95.161000
## [241]  -74.773000  -74.846667  100.046192  -61.770552  -16.687185  -46.336642
## [247]  -44.315000  -89.287299   80.485874  -61.079328  -16.889277  -39.084768
## [253]   79.848305  -47.992521  -43.016682  -76.632008   81.444669   79.824075
## [259]  -16.905198  -61.525244  100.499552  -46.855204  -61.745957  -47.962788
## [265]  -54.961193  -46.336670  -61.718050  -51.373193  -47.474020  -49.313520
## [271]  -61.444786  -61.065801  -46.509166  -44.654857  -46.567869  -46.379973
## [277]  -43.660984  123.135124  -88.138787  -34.953908  -61.525098  -47.349115
## [283] -105.226746  -48.867270  -43.559413  -88.138656  -88.138657  -88.138691
## [289]  -50.965099  -40.687680  -90.482462  -82.479214  -75.561901   79.903887
## [295]  -89.185934  -52.273861  -60.661267  -43.732709  -47.255025  -61.770492
## [301]  -51.351218  -61.779657  -83.691486  -38.434093  -47.800753  -64.681603
## [307]  -61.623571   73.488086  -39.093900   39.730517  -42.844127  -70.817323
## [313]  -47.896262  100.306095  -47.356389  -61.797081   85.905762   85.906302
## [319]  -47.850708  -60.927227  -38.525353  -49.460944  -88.015753  -46.482431
## [325]  -47.348032  -44.534246  -89.252188  -89.367535   73.960632  -47.884052
## [331]  -47.536713  -48.996911   92.710396  -38.456515  -61.269748   11.524353
## [337]  -47.038440  -43.301389  -41.988846  -47.432224  -50.708960  -39.171639
## [343]  -39.171687  -75.566526  -58.310214  -50.898364  -47.842715   32.328809
## [349]  -34.825359  -47.835648  -43.370967  -48.354384    6.641345  -76.197213
## [355]  -79.398737  -89.675016  -48.364722 -105.238744   83.184025  -43.495681
## [361]  -45.840894  -47.443767  -65.399405  -47.871411  -89.210884  -46.382929
## [367]  -64.681367  -40.827298  -17.377803  -43.367318  -54.952443   74.331101
## [373]   -1.115959  -38.150302   77.698046  -41.571483  -47.272624   79.796691
## [379]  -44.848437  -35.042257  119.890659  -48.084229  -59.218860  -48.085228
## [385]  -49.097657  -73.828947    1.789792  -42.458275  -61.077579  -49.135637
## [391]   75.382482  -54.258872    2.664797  -76.631919  -54.459223   73.695129
## [397]  -47.188779  -42.384634  -63.146672  -56.074486  -85.701242  -46.111137
## [403]  115.498833  -36.019717  -36.019722  -48.113674  100.007424   84.875046
## [409]  -39.196116 -149.594986  -50.440605  -76.222998  107.894363  -54.621029
## [415]  -75.192459  -37.458700  -90.303787    2.132474  -61.802186  -66.227862
## [421]  -44.678862  -52.275772  -37.767390  -54.956082  119.792466  -47.791977
## [427]  -50.373313  -50.383704  -38.571514  -49.183337  101.694244  -63.936993
## [433]  -79.893291  -47.381157  -44.527547  -61.070660  -49.474997   73.613328
## [439]  -48.290089  -38.615426  -61.402539  -48.151152   48.186243   79.245425
## [445]  -60.682438  -56.706378  -44.802389   55.425720   55.425620  -74.836050
## [451]  -48.232952   73.300828   80.458740  -38.886676  -56.107546  -61.266223
## [457]  -43.661272  -47.938483    2.615014  -61.587538  -16.731388   73.622954
## [463]   73.617744  -44.113955  -16.735347   74.805786   -1.569456  -37.103958
## [469]  -47.948647  -56.086364  -89.390331  -34.946950   -0.361448  -43.780053
## [475]  -43.468600  -43.536217  -38.381329  -48.947473   77.530068  -40.375069
## [481]  -38.389648
## 
## $issues
##  [1] "cdc,cdround"           "cdc"                   "cdc,gass84,inmano"    
##  [4] ""                      "cdc,cdround,cudc"      "cdc,cudc"             
##  [7] "cdround"               "cdc,cudc,gass84"       "gass84,inmano"        
## [10] "gass84,colmafu,inmafu" "cdc,gass84"           
## 
## $basisOfRecord
## [1] "HUMAN_OBSERVATION"  "PRESERVED_SPECIMEN"
## 
## $occurrenceStatus
## [1] "PRESENT"
## 
## $rightsHolder
##  [1] "Whitney Ramsey"                                                
##  [2] "Elavarasan M"                                                  
##  [3] "Chris"                                                         
##  [4] "wineberrytown"                                                 
##  [5] "Steve Maldonado Silvestrini"                                   
##  [6] "zicky"                                                         
##  [7] "kaileyslater"                                                  
##  [8] "winterling"                                                    
##  [9] "Yamilette Herrera Estévez"                                     
## [10] "Asher Gorbet"                                                  
## [11] "geralg"                                                        
## [12] "Haneesh K M"                                                   
## [13] "Fabiany Alessia Figueroa Guerra"                               
## [14] "mcknz"                                                         
## [15] "heatherchar"                                                   
## [16] "Pravin Kawale"                                                 
## [17] "virenvaz"                                                      
## [18] "UEC - Herbário da Universidade Estadual de Campinas"           
## [19] NA                                                              
## [20] "erisy"                                                         
## [21] "psyyclops"                                                     
## [22] "Don Marsille"                                                  
## [23] "Leonardo Oliveira"                                             
## [24] "sreenivasan"                                                   
## [25] "Prajwal J Ullal"                                               
## [26] "Dr. Preeti V. Phate"                                           
## [27] "HAMADOU SOUMANA Oumarou"                                       
## [28] "Autumn"                                                        
## [29] "John Jaime Acevedo Roldán"                                     
## [30] "edj_rivas"                                                     
## [31] "La Rata Mutante"                                               
## [32] "Keerthi Vijay"                                                 
## [33] "turtlepada"                                                    
## [34] "Abhishek Jamalabad"                                            
## [35] "Kristof Zyskowski"                                             
## [36] "Samadori S. Honore Biaou"                                      
## [37] "Matías Zarucki"                                                
## [38] "elrivera"                                                      
## [39] "shaanaroeste"                                                  
## [40] "Gayatri Pawar"                                                 
## [41] "James Bailey"                                                  
## [42] "Phan Vũ Phúc Lân"                                              
## [43] "sabrinacabereracim2020"                                        
## [44] "zeres Cubilla"                                                 
## [45] "Anderson Mesa C"                                               
## [46] "Hiran Amarasekera"                                             
## [47] "erinbloomtenn"                                                 
## [48] "Alex Ennis"                                                    
## [49] "barbarapaisx"                                                  
## [50] "coraimamv"                                                     
## [51] "carlotaguevara"                                                
## [52] "saraerdei"                                                     
## [53] "HUTO - Herbário da Universidade de Tocantins"                  
## [54] "bonbonbig"                                                     
## [55] "rafaela0508"                                                   
## [56] "auderabaud"                                                    
## [57] "HUESB - Herbário da Universidade Estadual do Sudoeste da Bahia"
## [58] "UESC - Herbário Universidade Estadual de Santa Cruz"           
## [59] "Franco Colnago"                                                
## [60] "Luciano Bernardes"                                             
## [61] "David Martin"                                                  
## [62] "SLUI - Herbário Rosa Mochel"                                   
## 
## $datasetName
## [1] "iNaturalist research-grade observations"                                  
## [2] "UEC - Herbário da Universidade Estadual de Campinas"                      
## [3] "Estudio de Impacto Ambiental, Área de perforación exploratoria LLANOS 124"
## [4] NA                                                                         
## [5] "HUTO - Herbário da Universidade de Tocantins"                             
## [6] "HUESB - Herbário da Universidade Estadual do Sudoeste da Bahia"           
## [7] "UESC - Herbário Universidade Estadual de Santa Cruz"                      
## [8] "SLUI - Herbário Rosa Mochel"                                              
## 
## $recordedBy
##  [1] "Whitney Ramsey"                                     
##  [2] "Elavarasan M"                                       
##  [3] "Chris"                                              
##  [4] "wineberrytown"                                      
##  [5] "Steve Maldonado Silvestrini"                        
##  [6] "zicky"                                              
##  [7] "kaileyslater"                                       
##  [8] "winterling"                                         
##  [9] "Yamilette Herrera Estévez"                          
## [10] "Asher Gorbet"                                       
## [11] "geralg"                                             
## [12] "Haneesh K M"                                        
## [13] "Fabiany Alessia Figueroa Guerra"                    
## [14] "mcknz"                                              
## [15] "heatherchar"                                        
## [16] "Pravin Kawale"                                      
## [17] "virenvaz"                                           
## [18] "Ferronato, P"                                       
## [19] NA                                                   
## [20] "erisy"                                              
## [21] "psyyclops"                                          
## [22] "Don Marsille"                                       
## [23] "Leonardo Oliveira"                                  
## [24] "sreenivasan"                                        
## [25] "Prajwal J Ullal"                                    
## [26] "Dr. Preeti V. Phate"                                
## [27] "HAMADOU SOUMANA Oumarou"                            
## [28] "Autumn"                                             
## [29] "John Jaime Acevedo Roldán"                          
## [30] "edj_rivas"                                          
## [31] "La Rata Mutante"                                    
## [32] "Keerthi Vijay"                                      
## [33] "turtlepada"                                         
## [34] "Abhishek Jamalabad"                                 
## [35] "Kristof Zyskowski"                                  
## [36] "Samadori S. Honore Biaou"                           
## [37] "Matías Zarucki"                                     
## [38] "elrivera"                                           
## [39] "shaanaroeste"                                       
## [40] "Gayatri Pawar"                                      
## [41] "James Bailey"                                       
## [42] "Phan Vũ Phúc Lân"                                   
## [43] "Thomas Vattakaven"                                  
## [44] "Susanta Tanti"                                      
## [45] "Carlos Altamar|Maria Malagón"                       
## [46] "Altamar Carlos|Malagón María"                       
## [47] "sabrinacabereracim2020"                             
## [48] "zeres Cubilla"                                      
## [49] "Anderson Mesa C"                                    
## [50] "Hiran Amarasekera"                                  
## [51] "erinbloomtenn"                                      
## [52] "Alex Ennis"                                         
## [53] "barbarapaisx"                                       
## [54] "coraimamv"                                          
## [55] "carlotaguevara"                                     
## [56] "saraerdei"                                          
## [57] "Marlon, B."                                         
## [58] "bonbonbig"                                          
## [59] "rafaela0508"                                        
## [60] "auderabaud"                                         
## [61] "E.O. Dantas; K.L. Céo Guimarães; K.L. Céo Guimarães"
## [62] "E.O. Dantas"                                        
## [63] "Franco Colnago"                                     
## [64] "Luciano Bernardes"                                  
## [65] "David Martin"                                       
## [66] "Barbosa, L.S.V."                                    
## [67] "Senterre, Bruno|Morel,  Sophie"                     
## [68] "Malagón María|Altamar Carlos"                       
## 
## $locality
##  [1] NA                                                                                                     
##  [2] "Serra Azul. Assentamento Sepé Tiaraju: Lote Arlindo. Lat 21°14#?#29#?##?#S Long 47°32#?#54#?##?#W"    
##  [3] "Cabuyarito / La Embajada"                                                                             
##  [4] "Mercados de Barranquilla, en cercanias a la plaza de San Nicolás"                                     
##  [5] "Mercados de Barranquilla,  en cercanias a la plaza de San Nicolás."                                   
##  [6] "Centro de Ciências Agrárias - CCA."                                                                   
##  [7] "Sitio Nery, Rua A da Independência, descida da fonte. Área aberta, gramada. Coletas a 20m da estrada."
##  [8] "Comunidade Bonfim"                                                                                    
##  [9] "Port Glaud"                                                                                           
## [10] "Parque Villa Santos, carrera 49D esquina calle 101, corredor verde."                                  
## 
## $habitat
## [1] NA                                     
## [2] "Pastos limpios"                       
## [3] "Áreas Urbanas"                        
## [4] "Degraded inselberg area near the road"
## [5] "Áreas verdes urbanas"                 
## 
## $stateProvince
##  [1] "Belize"                       "Tamil Nadu"                  
##  [3] "La Libertad"                  "Soufrière"                   
##  [5] "Dorado"                       "North"                       
##  [7] "Cayo"                         "Goa"                         
##  [9] "Santiago"                     "Rivas"                       
## [11] "Karnataka"                    "Cortés"                      
## [13] "Vieques"                      "Baie Lazare"                 
## [15] "Maharashtra"                  "São Paulo"                   
## [17] "Meta"                         NA                            
## [19] "Trang"                        "Oaxaca"                      
## [21] "Santa Rosa"                   "Rio Grande do Norte"         
## [23] "Kerala"                       "Atakora"                     
## [25] "Upper Takutu-Upper Essequibo" "Antioquia"                   
## [27] "Los Santos"                   "Coclé"                       
## [29] "Andaman and Nicobar"          "Borgou"                      
## [31] "Bahia"                        "San Lorenzo"                 
## [33] "Surat Thani"                  "Matanzas"                    
## [35] "Khánh Hòa"                    "Atlántico"                   
## [37] "Guatemala"                    "Bocas del Toro"              
## [39] "Colombo"                      "Cayenne"                     
## [41] "São Tomé"                     "Panamá"                      
## [43] "Santa Ana"                    "Tocantins"                   
## [45] "Guanacaste"                   "Bali"                        
## [47] "Antsiranana"                  "Amazonas"                    
## [49] "Mato Grosso"                  "Maranhão"

1.3. Validação dos dados

1.3.1. Agora iniciaremos uma avaliação mais minuciosa dos dados, como a validação das coordenadas geográficas usando as funções dos pacotes CoordinateCleaner e bcd.
# checar coordenadas válidas
check_pf <- 
  bdc::bdc_coordinates_outOfRange(
    data = ana_gbif1,
    lat = "decimalLatitude",
    lon = "decimalLongitude")

# checar coordenadas válidas e próximas a capitais (muitas vezes as coordenadas são erroneamente associadas a capitais dos países)

cl <- ana_gbif1 %>%
  select(acceptedScientificName, decimalLatitude, decimalLongitude) %>%
  rename(decimallongitude = decimalLongitude,
         decimallatitude = decimalLatitude,
         scientificName = acceptedScientificName) %>% 
  as_tibble() %>% 
  mutate(val = cc_val(., value = "flagged"),
         sea = TRUE,
         capital = cc_cap(., value = "flagged"))
1.3.2. A visualização desses resultados por uma imagem torna a análise mais compreensivel, além de validarmos os dados e descartamos possíveis ocorrências da espécie Anacardium occidentale no mar. Afinal, o cajueiro é uma planta de habitat terrestre.

1.3.3. Através de uma rápida observação é possível verificarmos alguns sinais de alerta, marcadas em vermelho na página.
## [1] "iNaturalist research-grade observations"                                  
## [2] "UEC - Herbário da Universidade Estadual de Campinas"                      
## [3] "Estudio de Impacto Ambiental, Área de perforación exploratoria LLANOS 124"
## [4] NA                                                                         
## [5] "HUTO - Herbário da Universidade de Tocantins"                             
## [6] "HUESB - Herbário da Universidade Estadual do Sudoeste da Bahia"           
## [7] "UESC - Herbário Universidade Estadual de Santa Cruz"                      
## [8] "SLUI - Herbário Rosa Mochel"

1.3.4. Como formar de garantir a segurança de nossos dados, usaremos apenas ocorrências registradas em herbários e excluiremos os demais. Os herbários são ferramentas científicas valiosas e “bibliotecas” da flora, sendo assim há a necessidade de constante organização e validação dos materiais depositados, trazendo mais segurança a nossas análises.
## # A tibble: 0 × 1
## # … with 1 variable: datasetName <chr>
1.3.5. As ocorrências em vermelho podem ocasionalmente terem sido registradas próximas a regiões insulares, o que justificaria a presença desses pontos no que visualmente consideramos água. Após a filtragem e retirada dos dados que não possuem registros em herbários podemos checar o novo mapa.

2. Após as etapas inicias de limpeza e validação, partiremos para algumas análises e breve discussão dos resultados obtidos.

2.1. De inicial podemos notar que a espécie apresenta uma ampla distribuição nas regiões de clima tropical e, especialmente no território brasileiro. Há diversar hipóteses que tratam sobre a origem de A. occidentale, as mais atuais são pautadas em provas circunstanciais que aponta o Brasil como o centro de irradiação da espécie; acredita-se que vasta dispersão pelos territórios de clima tropical tenha ocorrido inicialmente por colonizadores portugueses e espanhóis. Como forma de revalidar essas informações, realizaremos uma análise de coorelação entre a ocorrência de A. occidentale e longitude.
2.2. Para essa análise usaremos pacotes da biblioteca Plotly, que permite a criação de gráficos interativos simples.
## `summarise()` has grouped output by 'lat'. You can override using the `.groups`
## argument.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
2.3. Pela Visualização do gráfico, fica clara que a distribuição de A. occidentale ocorre majoritariamente entre as latitudes -30 e 20. Uma possível explicação a essa distribuição pode ser dada pelas carcterísticas morfológicas e fisiológicas da espécie, que apresenta atributos eficientes para lidar com altas temperaturas e suportar o déficit hídrico. Podemos visualizar a distribuição de A.occidentale em relação a longitude e confirmar nossa afirmação, vejamos:
## `summarise()` has grouped output by 'lat'. You can override using the `.groups`
## argument.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
De fato A. occidentale apresenta uma distribuição dispersa entre os países dentro da região tropical, tendo poucas ocorrências em regiões de clima temperado (Imagem 1).

Imagem 1

O fruto e pseudofruto do cajú são a principal fonte de renda de diversas famílias pelo mundo. No Brasil, a cajucultura é um setor forte e ascendente em diversos estados do país, em destaque aos estados do Piauí e Ceará e Rio Grande do Norte (Imagem 2)

Imagem 2

Podemos concluir que A. occidentale possui ampla distribuição nos países da região tropical, tendo sua ocorrência restrita a regiões em que predominam as características climáticas tropicais, com destaque ao Brasil, possível fonte primária de dispersão da espécie.

O script completo dessa atividade em formato .Rmd pode ser consultado Aqui

Caso tenha lido o trabalho até essa parte, um bônus: Durante uma de nossas aulas, houve o questionamento se haveria a necessidade de selecionarmos manualmente todas as alterações na aba “git” antes de realizar o commit. Obtivemos um sim como resposta. O grande volume de alterações que tive de fazer, minha preguiça e curiosidade patológica encontraram uma solução: no terminal, digite o comando “git add .” (com espaço) e tudo se resolve. Amém!